FILTER MODE ACTIVE

#агенты разработки ПО

Найдено записей: 1

#агенты разработки ПО13.08.2025

Reinforcement Learning открывает потенциал открытых LLM для долгих задач в разработке ПО

Исследование Nebius AI и Humanoid применяет модифицированный DAPO для обучения открытой модели Qwen2.5 на многотуровых задачах разработки ПО, добившись 39% Pass@1 на SWE-bench Verified без учителя.